Genómica comparativa

Objetivos
  1. Interpretar alineamientos de genomas.
  2. Poner en práctica conceptos evolutivos clave e inferir ortólogos y parálogos.
  3. Diseñar e implementar análisis comparativos para interrogar datos genómicos.

Datos:

La práctica a realizar se basa parcialmente en este artículo de acceso libre donde se analizan los genomas completos de Archaea disponibles hasta el año 2003. Utilice la Tabla 1 referenciada en el artículo para escoger 6 genomas de géneros o familias de arquea que estén más o menos relacionados entre sí (es decir, pueden ser dos genomas de un mismo género, dos de otro género de la misma familia, y dos de otra familia).

Nota: La combinación de los genomas es de su elección, la idea es que haya distintos grados de distancia evolutiva entre los genomas seleccionados.

I. Análisis de genomas

  1. En la página de ncbi busque los genomas seleccionados. Descargue los genomas a su computador (descargue (a) el genoma completo en fasta y (b) las secuencias de aminoácidos en fasta). Seleccione uno de los genomas como referencia y los otros van a ser usados para su comparación.

  2. Usando la herramienta MAUVE realice el alineamiento multiple (para cada conjunto de genomas por separado).

Nota: Esta herramienta se descarga a su máquina (su propio computador, es un programa de interfaz gráfica y se encuentra disponible para todos los sistemas operativos.

  1. Entregue un pantallazo del alineamiento para cada grupo de genomas.

  2. ¿Sí soportan su hipótesis que habían un conjunto de genomas más cercanamente asociado entre si que el otro? Discuta.

  1. Entre a la página de Integrated Microbial Genomes (IMG); vaya a la pestaña de “Compare Genomes”, después “Average Nucelotide Identity” y finalmente “Pairwise ANI”. Calcule el ANI pareado entre todos sus genomas, para cada grupo de interés por separado. Si tiene dudas del uso de la herramienta puede consultar este Webinar.
  1. Indique cuál fue el ANI y la Fracción Alineada (AF) para cada comparación.

  2. Interprete los resultados, le indica más o menos lo mismo que encontró en el punto anterior?

  1. Vamos a hacer un análisis de ortólogos para los genomas. Para esto usaremos el programa OrthoVenn2, el cual está disponible en una plataforma web, y se utiliza para la comparación y anotación de grupos de genes ortólogos entre múltiples especies. No se requiere instalación ni registro. Funciona en cualquier sistema operativo con un navegador moderno y Javascript habilitado.

Un tutorial detallado para su uso se encuentra disponible en este enlace.

  1. Lo primero que debe hacer es subir al sitio web los seis proteomas de los organismos que escogió. Es decir los archivos de proteínas en formato fasta (los descargó en el punto 1). Asigne a cada proteoma a una palabra que represente el organismo seleccionado, e.g. Human (recuerde no incluir caracteres como espacios).

  2. Revise la información presentada en los resultados. Defina los conceptos básicos presentados, ¿a qué corresponden los siguientes términos?:

  • Cluster
  • Overlapping cluster number
  • Cluster count
  • Protein count
  • Singleton
  • Single copy gene cluster
  1. Interprete la información presentada. El gráfico de resumen muestra los grupos de genes ortólogos compartidos entre múltiples especies. ¿Qué tan similares son los genomas analizados? ¿Obtiene información adicional con respecto a lo analizado en los puntos anteriores?

  2. Haga clic en el botón “Pairwise HeatMap” (Mapa de calor por pares) visualice los números de clusters compartidos para las especies de interés de forma pareada. ¿El patrón obtenido corresponde con su predicción inicial?

  3. Al hacer clic en el número debajo de la columna “Cluster number” o en el número que aparece en el diagrama de Venn, se mostrarán los clusters compartidos entre especies. ¿A qué funciones biológicas corresponden los primeros 5 clusters en cada comparación?

→ Para entregar:

Entregue las respuestas a las interrogantes planteadas acompañadas de pantallazos de los resultados, cuando aplique.